ارائه یک سیستم برچسب گذاری خودکار اجزای واژگانی کلام برای متون فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر
- نویسنده مصطفی خوشحال
- استاد راهنما محمد هادی صدرالدینی مصطفی فخراحمد
- سال انتشار 1393
چکیده
برچسب گذاری اجزای واژگانی فرآیند انتساب دادن اجزای کلام یا واحد زبانی مناسب (فعل , اسم...) به هر کلمه در یک جمله زبان طبیعی می باشد. برچسب گذاری یک بخش مهم در پردازش زبان طبیعی می باشد و برای بسیاری از کاربرد های پردازش زبان سودمند است. برچسب گذاری اغلب اولین مرحله در پردازش زبان می باشد که پس از آن پردازش های دیگر از جمله بررسی کلمات انجام می شود. در این تز ما با استفاده از روش داده کاوی سعی داریم تا با بهبود در دقت برچسب گذاری کلمات ناشناخته، دقت کلی سیستم های خودکار برچسب گذار را بهببود بخشیم.
منابع مشابه
سیستم برچسب گذاری اجزای واژگانی کلام در زبان فارسی
Abstract: Part-Of-Speech (POS) tagging is essential work for many models and methods in other areas in natural language processing such as machine translation, spell checker, text-to-speech, automatic speech recognition, etc. So far, high accurate POS taggers have been created in many languages. In this paper, we focus on POS tagging in the Persian language. Because of problems in Persian POS t...
متن کاملارائه روشی برای برچسب گذاری اجزای کلام برای زبان فارسی
در پردازش زبان طبیعی سعی بر این است که کامپیوتر توانایی استخراج معنی از منابع زبان طبیعی را داشته باشد. به دلیل پیچیدگی پردازش زبان طبیعی و برای سادگی برخورد با چالش های پیش روی آن از ابزارهای مختلف و تخصصی برای مواجهه با هر یک از مشکلات استفاده شود. برچسب گذار نحوی اجزای کلام یکی از ابزارهایی است که می تواند به فرایند پردازش زبان طبیعی کمک کند. وظیفه برچسب گذار مشخص کردن نقش دستوری کلمات در جم...
15 صفحه اولتشخیص خودکار جنسیت نویسنده در متون فارسی
Gigantic amount of textual data being transfers in web everyday. like other communities,cyberspace is vulnerable to attacks, false information and deception.it becomes increasingly important to design an efficient method to trace identity in this community.to investigate the problem of gender identification,we propose 48 feature,and design three machine learning algorithms.the results of study ...
متن کاملارائه یک سیستم هوشمند و معناگرا برای ارزیابی سیستم های خلاصه ساز متون
Nowadays summarizers and machine translators have attracted much attention to themselves, and many activities on making such tools have been done around the world. For Farsi like the other languages there have been efforts in this field. So evaluating such tools has a great importance. Human evaluations of machine summarization are extensive but expensive. Human evaluations can take months to f...
متن کاملرویکردِ حوزهای به اجزای کلام در فارسی
در فرهنگها و کتابهای دستور زبان فارسی در مورد مقولۀ واژگانیِ تعدادِ قابلِ توجهی از واژههای این زبان از جمله مصادر، اسامی و صفاتِ گزارهای و افعالِ همکرد، اتفاقِ نظر وجود ندارد و این امر میتواند باعثِ پدید آمدنِ مشکلاتی برای زبانآموزان و محققانِ این زبان شود. در نظریۀ دستورِ حوزهای، زبان به حوزههای مستقلی تقسیم میشود و این حوزهها ممکن است در برخی از مدخلهای واژهها با هم تطابق نداشته باشند. در ا...
متن کاملارائه روشی جدید برای شاخصگذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشهبندی متون
Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, i...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023